第8回オペラント条件づけ

https://gyazo.com/e7c368184558fdcca1f3777a6563ebb8

https://amzn.to/3sugJ0v

1. 「ソーンダイクのネコ」の実験

ソーンダイクのネコ

問題箱 puzzle boxにネコを入れる

https://gyazo.com/dda5b3470a6fbff0a4fa20794a3b4956

複数の仕掛けを解くと外に出て餌を食べることができる

入れられてから外に出るまでの時間が測定された

経験を重ねるにつれて短い時間で外に出ることができるようになることが観察された(Thorndike, 1898)

試行錯誤学習(trial and error, trial and error learning)

効果の法則(law of effect)による説明

満足をもたらした反応は、それが繰り返されるとその場面と強く結合して、より起こりやすくなる

不快をもたらした反応は、逆に起こりにくくなる

2. 「スキナーのラット」の実験

スキナー箱

実験装置概要

レバー(lever)と餌トレイ(food tray)がついている

餌トレイは実験装置の外にある給餌器(feeder)につながっており、ある一定の条件に従って餌トレイに餌粒(ペレット pellet)が供給されるようになっている

食事制限をしたラットを入れ、

ラットがレバーを押すと餌粒がもらえるようにしておくと、ラットがレバーを押す反応の頻度が増えていく

ラットがレバーを押しても餌粒がもらえない条件にすると、レバーを押す反応率(一定時間毎の反応の頻度)が徐々に低下していく

自由オペラント型手続き(free operant procedure)

被検体は自由な反応を自発することができる

スキナーのような実験では飼育箱から実験装置に移されて、実験の被験体となる

実験手続きの整理

ベースライン条件

レバー押し反応に対して餌粒を与えない条件にしておｋつお、レバー押し反応の反応率は低いまま

ここで反応率とは、動物実験ということで、1秒/1分あたり、何回反応したか

通常、低い反応率が安定して見られるまで実験を続ける

介入条件

レバー押し反応に対して、実験で設定した基準に従って、餌粒を与えて、レバー押し反応の反応率がどのように変化するかを観察

この実験ではレバー押し反応の反応率が増加することが予想される

餌粒を用いるため

通常、予想された高い反応率が安定して見られるまで実験を続ける

再度ベースライン条件

レバー押し反応に対して餌粒を与えない条件で、レバー押し反応の反応率の変化を観察

最初の低い反応率と同程度の反応率となることが予想される

介入条件だけでレバー押し反応の反応率が高くなることが観察された場合に、オペラント条件づけが成立したとみなすことができる

(この例では)

強化子(reinforcer, 強化刺激 reinforcing stimulus)

反応率が高くなる方向

弱化子(罰子 punisher, 罰刺激 punishing stimulus)

反応率が低くなる方向

強化(reinforcement)

反応率が増加する一連の事態

弱化(punishment)

反応率が減少する一連の事態

「ソーンダイクのネコ」の実験

実験の厳密さに欠けるところはあるが

効果の法則

「満足をもたらした反応は…より起こりやすくなる」

強化に相当

「不快をもたらした反応は…起こりにくくなる」

弱化に相当

シャトル箱(shuttle box)

電気ショックという刺激が用いられる

シャトル箱は区画が分けられている

一方では床から電気ショックが与えられる

別の区画では電気ショックを受けないようになっている

被検体であるラットは、柵を超える反応をして別の区画に移って、電気ショックという刺激から、逃避(escape)あるいは回避(avoidance)という行動を学習

提示型と除去型

提示型(正の positive)

餌粒という刺激は、スキナー箱という環境につけ加えるという変化をもたらしている

除去型(負の negative)

電気ショックという刺激は、シャトル箱という環境から取り去るという変化をもたらしている

強化と弱化、提示型と除去型を組み合わせて4つの操作を想定することができる

提示型強化(正の強化) positive reinforcement

典型例

ラットのレバー押し反応への餌粒の提示

ハトのキーつつき反応への餌の提示

ヒトの子どもが良いことをしたらご褒美をあげる

いずれもオペラント条件づけにおいて最も一般的な手続き

提示型強化子(positive reinforcer)

提示型強化で提示される刺激

除去型強化(負の強化) negative reinforcement

ラットの柵越え反応によって電気ショックを受けないようになる状況

柵越反応が増加した場合が、除去型強化に相当

逃避

電気ショックという刺激柄逃れること

回避

電気ショックという刺激が提示されるのを妨げる/延期するようにすること

除去型強化子(negative reinforcer)

除去型強化で提示される刺激

嫌悪刺激

除去型強化と提示型弱化

提示型弱化(正の弱化) positive punishment

たとえばシャトル箱でラットが高頻度の行動をしたとして、その行動に随伴して電気ショックを与えた結果としてその行動の頻度が減少することが観察された場合

人間を対象とした場面であれば、教師の怒鳴り声によって生徒の私語が止まるという例

提示型弱化子(positive punisher)

提示型弱化で提示される刺激

嫌悪刺激

除去型強化と提示型弱化

除去型弱化(負の弱化) negative punishment

たとえば人間を対象とした場面で、子どもがいたずらをしたので、その日はテレビゲームをすることを禁じられた際に、そのいたずらという行動が減少したことが観察された場合

除去型弱化子(negative pusniher)

除去型弱化で提示される刺激

上の例ではテレビゲームを禁じること

table: 表8-1 オペラント条件づけの用語法(渡邉, 2019)

英語行動分析学辞典伝統的な用語法負の強化や負の罰の誤用が多いことから提案された用法

positive reinforcement 提示型強化正の強化好子提示による強化

negative reinforcement 除去型強化負の強化嫌子除去による強化 / 嫌子提示の阻止による強化

positive punishment 提示型弱化正の罰嫌子提示による弱化

negative punishment 除去型弱化負の罰好子除去による弱化 / 好子提示の阻止による弱化

reinforcer 強化子正の強化子好子

punisher 弱化子負の強化子嫌子

3. 反応形成

反応の変動性

スキナー箱のなかでいきなりレバーを押すというような反応は生じない

まずは単純に歩き回りながら周囲を嗅ぎ回ったり、立ち上がったりする

新しい環境への適応の現れと解釈することもできる

反応形成(shaping)

餌粒を与えながら最終的にレバー押し反応が取られるようになる

反応の変動性によってラットがたまたまレバーの近くにきた時

レバーの前に居る時間が増加する

たまたまレバーに触れた時

前肢をレバーに触れる反応の反応率が増加する

漸次的接近

少しずつ反応が形成されること

4. トークンエコノミー

言語行動は人間にとっては行動つまり反応であるが、刺激としても十分に機能している

「教師の怒鳴り声」

「テレビゲームをすることを禁じられる」

「テレビゲーム」という物自体は強化子として捉えることができる

それを「禁止する」という「言語行動」という刺激としての弱化子として捉えることができる

あるいは「テレビゲーム」という物自体がなくなるということで弱化子であると捉えることができる

「ご褒美をあげる」

「ご褒美」強化子

「褒める」という言語行動という刺激としての強化子として捉えることもできる

物自体としての「ご褒美」

操作化するとしたら

「おやつ」「お金(money)」

「おやつやお金に後で替えることができるもの」

代替貨幣

トークンエコノミー(token economy)

token

象徴、記号、札

economy

経済、経済学

代替するものが強化子として機能することを利用したオペラント条件づけについて検討されている

行動経済学

「強化子としてのお金」という観点から「経済学」の概念を検討し直す

人間の合理的な判断への疑問ということで認知心理学からの見直し

心理学と経済学の接点領域としての経済心理学としても注目されている

人間にとって「お金」は「記号」としての意味もある

記号学との関わりや言語学との関わりも想定される

→第9回弁別オペラント条件づけ